智能论文笔记

Purifier: Defending Data Inference Attacks via Transforming Confidence Scores

Ziqi Yang , Lijin Wang , Da Yang , Jie Wan , Ziming Zhao , Ee-Chien Chang , Fan Zhang , Kui Ren

分类：机器学习

2022-12-01

Neural networks are susceptible to data inference attacks such as the membership inference attack, the adversarial model inversion attack and the attribute inference attack, where the attacker could infer useful information such as the membership, the reconstruction or the sensitive attributes of a data sample from the confidence scores predicted by the target classifier. In this paper, we propose a method, namely PURIFIER, to defend against membership inference attacks. It transforms the confidence score vectors predicted by the target classifier and makes purified confidence scores indistinguishable in individual shape, statistical distribution and prediction label between members and non-members. The experimental results show that PURIFIER helps defend membership inference attacks with high effectiveness and efficiency, outperforming previous defense methods, and also incurs negligible utility loss. Besides, our further experiments show that PURIFIER is also effective in defending adversarial model inversion attacks and attribute inference attacks. For example, the inversion error is raised about 4+ times on the Facescrub530 classifier, and the attribute inference accuracy drops significantly when PURIFIER is deployed in our experiment.

translated by 谷歌翻译

Auto-Encoding Adversarial Imitation Learning

Kaifeng Zhang , Rui Zhao , Ziming Zhang , Yang Gao

分类：机器学习

2022-06-22

加强学习（RL）为决策提供了一个强大的框架，但是其实践中的应用通常需要精心设计的奖励功能。对抗性模仿学习（AIL）阐明了自动策略获取，而无需从环境中访问奖励信号。在这项工作中，我们提出了自动编码的对抗模仿学习（AEAIL），这是一个强大而可扩展的AIL框架。为了从演示中诱导专家政策，AEAIL利用自动编码器的重建误差作为奖励信号，该奖励信号比以前的基于歧视者提供了更多的优化策略信息。随后，我们使用派生的目标函数来训练自动编码器和代理策略。实验表明，与穆约科克环境中的最先进方法相比，我们的AEAIL表现优越。更重要的是，当专家演示嘈杂时，AEAIL表现出更好的鲁棒性。具体而言，我们的方法分别获得了$ 16.4 \％$ $和$ 47.2 \％$相对改进的总体，而最佳基线Fairl和PWIL分别在清洁和嘈杂的专家数据上。视频结果，开源代码和数据集可在https://sites.google.com/view/auto-encoding-imitation中找到。

translated by 谷歌翻译

Wavelet Regularization Benefits Adversarial Training

Jun Yan , Huilin Yin , Xiaoyang Deng , Ziming Zhao , Wancheng Ge , Hao Zhang , Gerhard Rigoll

分类：计算机视觉

2022-06-08

对抗训练方法是针对对抗性例子的最先进（SOTA）经验防御方法。事实证明，许多正则化方法与对抗训练的组合有效。然而，这种正则化方法是在时域中实现的。由于对抗性脆弱性可以被视为一种高频现象，因此必须调节频域中的对抗训练的神经网络模型。面对这些挑战，我们对小波的正则化属性进行了理论分析，可以增强对抗性训练。我们提出了一种基于HAAR小波分解的小波正则化方法，该方法称为小波平均池。该小波正则化模块集成到宽的残留神经网络中，因此形成了新的WideWavelEtResnet模型。在CIFAR-10和CIFAR-100的数据集上，我们提出的对抗小波训练方法在不同类型的攻击下实现了相当大的鲁棒性。它验证了以下假设：我们的小波正则化方法可以增强对抗性的鲁棒性，尤其是在深宽的神经网络中。实施了频率原理（F原理）和解释性的可视化实验，以显示我们方法的有效性。提出了基于不同小波碱函数的详细比较。该代码可在存储库中获得：\ url {https://github.com/momo1986/AdversarialWavelTraining}。

translated by 谷歌翻译

Understanding and Measuring Robustness of Multimodal Learning

Nishant Vishwamitra , Hongxin Hu , Ziming Zhao , Long Cheng , Feng Luo

分类：机器学习

2021-12-22

现代数字世界越来越多地成为多式联运。虽然多式化学习最近革命了多模式任务的最先进的性能，但对普发的环境中多式化学习的稳健性具有相对较小的。在本文中，通过专注于多峰模型中的输入方式的融合，介绍了多式化学习的对抗鲁棒性的全面测量，通过称为Muroan（多模式鲁棒性分析仪）。我们首先在穆拉南举行统一的多模式模型的统一视图，并确定多式联运模型的融合机制作为关键漏洞。然后，我们介绍了一种新型的多模式对抗攻击，称为穆罗的解耦攻击，旨在通过解耦它们的融合方式来损害多模型模型。我们利用Muroan的解耦攻击来测量几种最先进的多模型模型，并发现所有这些模型中的多模式融合机制都容易攻击攻击。我们特别证明，在最坏的情况下，Muroan的去耦攻击通过解耦仅为1.16％的输入空间来实现100％的攻击成功率。最后，我们表明，传统的对抗性培训不足以改善多式联模型相对于解耦攻击的鲁棒性。我们希望我们的调查结果鼓励研究人员追求改善多式化学习的稳健性。

translated by 谷歌翻译

TransZero++: Cross Attribute-Guided Transformer for Zero-Shot Learning

Shiming Chen , Ziming Hong , Guo-Sen Xie , Jian Zhao , Xinge You , Shuicheng Yan , Ling Shao

分类：计算机视觉 | 人工智能

2021-12-16

零射击学习（ZSL）通过将语义知识转移到看不见者的语义知识来解决新的类识别问题。通过单独使用单向关注，现有的基于关注的模型在单个图像中努力学习劣势区域特征，这忽略了视觉特征的可转换性和辨别属性定位。在本文中，我们提出了一个跨属性引导的变换器网络，称为Transzero ++，以改进可视化功能，并学习精确的属性本地化，用于ZSL中的语义增强的可视嵌入表示。 Transzero ++由Attribute $ \ LightArrow $ Visual Transformer子网（AVT）和Visual $ \ LightArrow $属性变压器子网（增值税）组成。具体而言，AVT首先采用功能增强编码器来缓解交叉数据集问题，并通过减少区域特征之间的缠绕的相对几何关系来提高视觉特征的可转换性。然后，使用属性$ \ lightArrow $可视解码器来本地化与基于属性的可视特征表示的给定图像中的每个属性最相关的图像区域。类似地，VAT使用类似的功能增强编码器来改进视觉功能，这些功能进一步应用于Visual $ \ lightarrow $属性解码器，以学习基于Visual-基的属性功能。通过进一步引入语义协作损失，两个属性引导的变压器通过语义协作学习互相教导学习语义增强的视觉嵌入。广泛的实验表明，Transzero ++在三个挑战ZSL基准上实现了新的最先进的结果。该代码可用于：\ url {https://github.com/shiming-chen/transzero_pp}。

translated by 谷歌翻译

Simultaneous Estimation of Hand Configurations and Finger Joint Angles using Forearm Ultrasound

Keshav Bimbraw , Christopher J. Nycz , Matt Schueler , Ziming Zhang , Haichong K. Zhang

分类：机器人 | 计算机视觉

2022-11-29

With the advancement in computing and robotics, it is necessary to develop fluent and intuitive methods for interacting with digital systems, augmented/virtual reality (AR/VR) interfaces, and physical robotic systems. Hand motion recognition is widely used to enable these interactions. Hand configuration classification and MCP joint angle detection is important for a comprehensive reconstruction of hand motion. sEMG and other technologies have been used for the detection of hand motions. Forearm ultrasound images provide a musculoskeletal visualization that can be used to understand hand motion. Recent work has shown that these ultrasound images can be classified using machine learning to estimate discrete hand configurations. Estimating both hand configuration and MCP joint angles based on forearm ultrasound has not been addressed in the literature. In this paper, we propose a CNN based deep learning pipeline for predicting the MCP joint angles. The results for the hand configuration classification were compared by using different machine learning algorithms. SVC with different kernels, MLP, and the proposed CNN have been used to classify the ultrasound images into 11 hand configurations based on activities of daily living. Forearm ultrasound images were acquired from 6 subjects instructed to move their hands according to predefined hand configurations. Motion capture data was acquired to get the finger angles corresponding to the hand movements at different speeds. Average classification accuracy of 82.7% for the proposed CNN and over 80% for SVC for different kernels was observed on a subset of the dataset. An average RMSE of 7.35 degrees was obtained between the predicted and the true MCP joint angles. A low latency (6.25 - 9.1 Hz) pipeline has been proposed for estimating both MCP joint angles and hand configuration aimed at real-time control of human-machine interfaces.

translated by 谷歌翻译

EgoSpeed-Net: Forecasting Speed-Control in Driver Behavior from Egocentric Video Data

Yichen Ding , Ziming Zhang , Yanhua Li , Xun Zhou

分类：计算机视觉 | 机器学习

2022-09-27

速度控制预测是驾驶员行为分析中一个具有挑战性的问题，旨在预测驾驶员在控制车速（例如制动或加速度）中的未来行动。在本文中，我们尝试仅使用以自我为中心的视频数据来应对这一挑战，与使用第三人称视图数据或额外的车辆传感器数据（例如GPS或两者）的文献中的大多数作品相比。为此，我们提出了一个基于新型的图形卷积网络（GCN）网络，即Egospeed-net。我们的动机是，随着时间的推移，对象的位置变化可以为我们提供非常有用的线索，以预测未来的速度变化。我们首先使用完全连接的图形图将每个类的对象之间的空间关系建模，并在其上应用GCN进行特征提取。然后，我们利用一个长期的短期内存网络将每个类别的此类特征随着时间的流逝融合到矢量中，加入此类矢量并使用多层perceptron分类器预测速度控制动作。我们在本田研究所驾驶数据集上进行了广泛的实验，并证明了Egospeed-NET的出色性能。

translated by 谷歌翻译

Poisson Flow Generative Models

Yilun Xu , Ziming Liu , Max Tegmark , Tommi Jaakkola

分类：机器学习 | 计算机视觉

2022-09-22

我们提出了一种新的“泊松流”生成模型（PFGM），该模型将高维半球上的均匀分布映射到任何数据分布中。我们将数据点解释为$ z = 0 $超平面上的电荷，在增加额外尺寸$ z $的空间中，产生了高维电场（泊松方程解决方案的梯度）。我们证明，如果这些电荷沿电场线向上流动，则它们在$ z = 0 $平面中的初始分布将变成半径$ r $半球的分布，该分布在$ r \ to \ infty $限制中变成均匀。为了学习徒的转化，我们估计了增强空间中的归一化场。对于采样，我们设计了一种由物理上有意义的附加尺寸锚定的向后ode：当$ z $达到零时，样本击中了未加重的数据歧管。在实验上，PFGM在CIFAR-10上的正常流量模型中实现了当前的最新性能，其成立分数为9.68美元，而FID得分为2.48美元。它还可以与最先进的SDE方法相同，同时提供$ 10 \ times $至$ 20 \ $ 20 \ times $ $加速图像生成任务。此外，PFGM在较弱的网络体系结构上似乎更宽容估计误差，并且对Euler方法中的步骤大小稳健。该代码可在https://github.com/newbeeer/poisson_flow上找到。

translated by 谷歌翻译

EnergonAI: An Inference System for 10-100 Billion Parameter Transformer Models

Jiangsu Du , Ziming Liu , Jiarui Fang , Shenggui Li , Yongbin Li , Yutong Lu , Yang You

分类：机器学习

2022-09-06

大型变压器模型在各种自然语言处理（NLP）任务上显示出令人鼓舞的性能。尽管AI社区已将模型量表扩展到了万亿个参数级别，但由于延迟，吞吐量和内存约束，仍不确定100亿参数模型的实际部署。在本文中，我们提出了Energonai，以解决单个或多GPU系统上有效部署1000亿参数变压器模型的挑战。 Energonai采用层次结构控制器系统体系结构来协调多个设备并有效支持不同的并行模式。它将子模型的执行委托给单个控制器样式的多个工人，并以多控制器样式的工人之间的工人之间的张量并行性和管道并行性。在新的架构上，我们提出了三种技术，即非阻滞管道并行性，分布式冗余计算消除和同行记忆池。 Energonai使用户能够编程复杂的并行代码与串行编码相同。与FertransFormer相比，我们已经证明，Energonai在延迟和吞吐量方面具有较高的性能。在我们的实验中，Energonai可以在张量并行性，管道并行性的10％可伸缩性中实现37％的潜伏期降低，并通过使用较大的异质记忆空间以有限的性能降低的成本来提高对单个GPU推断的模型量表。

translated by 谷歌翻译

Improving RGB-D Point Cloud Registration by Learning Multi-scale Local Linear Transformation

Ziming Wang , Xiaoliang Huo , Zhenghao Chen , Jing Zhang , Lu Sheng , Dong Xu

分类：计算机视觉

2022-08-31

点云注册旨在估计两点云扫描之间的几何变换，在该点对应的估计中是其成功的关键。除了先前通过手工制作或学习的几何特征寻求对应的方法外，最近的点云注册方法还尝试应用RGB-D数据以实现更准确的对应关系。但是，有效地融合了这两种独特方式的几何和视觉信息并不是微不足道的，尤其是对于注册问题而言。在这项工作中，我们提出了一种新的几何感知视觉特征提取器（给出），该提取器采用多尺度的本地线性转换来逐步融合这两种方式，其中深度数据的几何特征是几何依赖于几何依赖的卷积内核来转换RGB数据的视觉功能。最终的视觉几何特征位于典型的特征空间中，由于几何变化引起的视觉差异可缓解，因此可以实现更可靠的对应关系。提出的给出的模块可以很容易地插入最近的RGB-D点云注册框架中。在3D匹配和扫描仪上进行的广泛实验表明，即使没有信件或姿势监督，我们的方法即使在没有通信或姿势的情况下也优于最先进的点云注册方法。该代码可在以下网址获得：https：//github.com/514DNA/llt。

translated by 谷歌翻译